﻿ ACADEMIA DE STUDII ECONOMICE Facultatea: Cibernetică, Statistică şi Informatică Economică Analiza econometrica Student: POPESCU MIRUNA IOANA Modelul analizat ia in considerare 23 de observatii asupra masinilor second-hand, marca Audi,model A6, pentru a evalua infleunta kilometrajului si anului de productie asupra pretului de vanzare a masinilor. Anul de referinta este 2017. Datele au fost preluate de pe site-ul Autovit. 2.MODELUL UNIFACTORIAL DE REGRESIE Distingem variabila X-kilometrii facuti cu masina(km) si Y-pretul automobilului(RON). Utilizam modelul liniar unifactorial: yi= a + bxi + εi, i=1,2,…,n 2 Reprezentarea grafica a datelor de observatie : Figură 1. Legatura pret-kilometraj Din grafic se observă că între variabilele X şi Y există o legătură indirecta şi liniară Dreapta de regresie estimata este: yi=28189-0.0681xi Fiecare punct de pe dreapta de regresie este o estimatie a valorii medii a lui Y, corespunzator valorii alese pentru X. Deci yi este o estimatie pentru E(Y|Xi). a)Estimarea parametrilor modelului in Excel si comentare a valorilor unor indicatori din tabel: ̂ Obtinem â=28188.73 si b=-0.0681 â=28188.73 :arată pretul unui automobil, atunci când kilometrajul este 0. În general, parametrul de interceptare nu are semnificatie economică. Vom interpreta pe a ca fiind efectul mediu asupra lui Y, al tuturor factorilor care nu sunt luati în considerare în modelul de regresie. ̂ b=-0.0681:măsoară panta dreptei de regresie şi arată că, atunci când kilometrajul(X) creşte cu 1 km, pretul autoturismului (Y) scade, în medie, cu 0.07 RON. 3 Coeficientul de determinare (R Square) arata proportia din variatia totala a valorilor variabilei dependente Y, explicata de variatia variabilei independente X, deci prin modelul de regresie REGRESIA IN EXCEL: SUMMARY OUTPUT Figură 2: Regresia in Excel Regression Statistics Multiple R 0.649481 R Square 0.421826 Adjusted R Square 0.392917 Standard Error 10840.02 Observations 22 ANOVA Significance df SS MS F F Regression 1 1.71E+09 1714608655.07 14.59167 0.001072 Residual 20 2.35E+09 117506020.06 Total 21 4.06E+09 Standard Upper Lower Upper Coefficients Error t Stat P-value Lower 95% 95% 95.0% 95.0% Intercept 28188.73 5226.546 5.393376 2.8E-05 17286.34 39091.11 17286.34 39091.11 X Variable 1 -0.0681 0.017827 -3.8199 0.001072 -0.10528 -0.03091 -0.10528 -0.03091 Interpretare: 48.18% din variatia valorilor variabilei Pretul autoturismului se poate explica prin variatia valorilor variabilei Kilometrii facuti. 4 REGRESIA IN EVIEWS: Figură 3:Regresia in EViews b) Testarea semnificatiei parametrului pantă b si interval de incredere pentru acesta H0: b=0 (parametrul panta b nu este semnificativ statistic) H1: b≠0 (parametrul panta b este semnificativ statistic) Statistica: t=( b/ Sb) urmeaza o distributie Student cu (n-2) grade de libertate dacă H0 este adevarata. Daca tcalc>ttab respingem H0 si acceptam H1 P-value- Probabilitatea asociata este 0.001072< 0,05 (nivelul de semnificatie), deci respingem H0 si acceptam H1, parametrul panta este semnificativ statistic. Spunem ca o statistica este semnificativa daca valoarea testului statistic se gaseste in regiunea critica. In acest caz, se respinge H0 Intervalul de incredere 100(1-α)% pentru parametrul a este de forma (b - ttabSb<b< b + ttabSb) Vom prelua limita inferioara si limita superioara a intervalului din tabelul ANOVA: (-0.10528< b < -0.03091) Interpretand coeficient de incredere de 95% pe termen lung, in 95 din 100 cazuri, intervale precum intervalul (-0.10528< b < -0.03091),vor include valoarea reala a parametrului b. 5 Intervalul construit nu contine valoarea 0, deci avem inca un argument in favoarea ipotezei H1 ca b ≠ 0, adica putem spune ca “X are putere explicativa semnificativa pentru Y” sau “b este semnificativ diferit de 0” sau “b este semnificativ statistic”. Estimarea parametrilor modelului cu ajutorul pachetului EViews4.1 Apar coeficientii de regresie estimati, erorile standard ale estimatorilor parametrilor, statisticile t si P-value. Vom observa, de asemenea, media si abaterea standard a variabilei dependente Y, eroarea standard a estimatiei, coeficientul de determinare R-Squared, statistica F si P-value asociata. c) Testarea validitatii modelului Pentru testarea validitatii modelului se formulează 2 ipoteze: H0: modelul nu este valid statistic (MSR=MSE) (X-kilometrajul nu are efect asupra lui Y- pretul) H1: modelul este valid statistic (MSR>MSE) (X are influenta asupra lui Y) Statistica F= (MSR/MSE) are o distributie Fα;1; n−2 Dacă Fcalculat>Fcritic respingem H0 şi acceptăm H1 ⇒ Modelul este valid statistic. Fcalculat=1714608655.07/117506020.06=14.59 pentru un nivel de semnificatie 0,05 : Fcritic=5.32 Deoarece 14.59 > 5,32 ⇒ respingem H0 ⇒ acceptăm H1 ⇒ Modelul este valid statistic la pragul de semnificatie de 5%. Din tabelul ANOVA si conform ipotezei H1 putem afirma ca modelul este valid statistic deoarece MSR>MSE, adica 1714608655.07>117506020.06. SignificanceF(probabilitate critică)este 0.001072<0,05(pragul de semnificaţie).Modelul de regresie construit este valid şi poate fi utilizat pentru analiza dependenţei dintre cele două variabile. d) Verificarea îndeplinirii ipotezelor modelului clasic de regresie liniară d1) Testarea homoscedasticitatii erorilor aleatoare 6 Figură 4: Homoscedasticitatea erorilor aleatoare Figură 5: Heteroscediscitatea Testul White H0: c1=c2=0 (erorile aleatoare sunt homoscedastice) H1: nonH0 (erorile aleatoare sunt heteroscedastice) 7 Dacă Probabilitătile asociate statisticilor calculate sunt mai mici decât nivelul de semnificatie ales, respingem H0 şi acceptăm H1 ⇒ erorile aleatoare sunt heteroscedastice. Observăm că Prob. F=0,0000 iar Prob. Chi-square=0,0004. Deoarece probabilitatile < 0,05 respingem H0 si acceptam H1 => erorile aleatoare sunt heteroscedastice. Corectarea heteroscedasticitătii erorilor aleatoare: Respecificarea modelului Transformarea logaritmică este folosită în mod frecvent pentru a elimina heteroscedasticitatea, deoarece reduce dispersia variabilelor initiale. Se estimează prin MCMMP modelul: ln y=a+b ln x1+ εi 8 Un avantaj al modelului log-liniar sau dublu logaritmic, este că panta măsoară elasticitatea lui Y în raport cu X, adică modificarea procentuală în Y, pentru o modificare procentuală în X. Figură 6:Modelul dublu logaritmic aplicăm testul White şi obtinem: Deoarece Prob(Obs*R-squared)=0,1668>α (α=0,05) nu respingem H0 (acceptăm H0). ⇒ Erorile aleatoare sunt homoscedastice. d2) Verificarea ipotezei de non-autocorelare (independentă) a erorilor aleatoare Verificarea ipotezei de non-autocorelare a erorilor aleatoare prin metoda grafică D3)Detectarea autocorelării erorilor aleatoare. Testul DURBIN-WATSON Testul Durbin-Watson verifică dacă există autocorelare de ordinul întâi în seria reziduurilo 9 H0: ρ=0 (nu exista autocorelarea erorilor) H1: ρ diferit de 0 (exista autocorelare de ordinul I a erorilor aleatoare In outputul din figura.... gasim valoarea statisticii DW=0.933211 Din tabelul distributiei DW , pentru nivelul de semnificatie 5% , n=22 si k=1. d1 < DW < 4 - d2 , vom trage concluzia ca nu exista autocorelare si ca reziduurile sunt independente . d4)Testarea normalitatii erorilor Testul Jarque-Bera ia in considerare atât coeficientul de asimetrie cât şi cel de aplatizare şi verifică în ce măsură distribuţia empirică poate fi aproximată cu o distribuţie normală. Ipoteza nulă a acestui test presupune că eşantionul de date provine dintr-o distribuţie normală. Statistica JB are o distribuţie asimptotică χ2. Conform distribuţiei χ2, valoarea critică a testului Jarque-Bera pentru un grad de semnificaţie statistică de 5% este 5,99. Cu alte cuvinte, dacă statistica JB calculată pentru o serie de radamente este mai mare de 5,99 respingem ipoteza nulă. Acest test calculează mai întâi coeficientul de asimetrie (Skewness) şi coeficientul de boltire (Kurtosis) pentru reziduurile obtinute prin MCMMP. Ipotezele de testat sunt: H0: Reziduurile au distribuŃie normală ( 0 =S şi 3 =K ) H1: Reziduurile nu au distribuŃie normală 10 Jarque-Bera = 1.593945Probability = 0,450691. Deoarece Probabilitatea asociată statisticii JB este > 0,05 acceptăm H0 ⇒ Reziduurile au distributie normală. e) Previzionarea valoarii variabilei dependente Y dacă variabila X creşte cu 10% fată de ultima valoare înregistrată. XN=199000*1,1=218900 YP =a+b XN YP =28198-0.0681*218900 YP =28189-14907,09 YP =13281,91 11 3) Modelul econometric multifactorial: Modelul cu o singură variabilă explicativă nu este foarte adecvat în practică, dacă se Ńine seamă de faptul că o variabilă economică poate fi explicată rareori printr-o singură variabilă factorială. De aceea apelam la introducerea unei variabile noi, ce ne permite să studiem mai multi factori care afectează variabila dependentă Y. Modelul de regresie liniară multiplă poate fi specificat sub forma: yi = ao + a1xi1 + a2xi2 + εi, i=1,2,…,n Modelul de regresie liniară multiplă este folosit pentru a studia dependenta dintre o variabilă dependentă y şi k variabile independente, precum şi o variabilă de perturbatie ε . Distingem variabilele : Y-Pretul autoturismului marca AudiA6,second-hand X1- Kilometrajul facut cu acesta pana in annul de referinta(2017) X2- Vechimea autoturismului, exprimata prin diferenta intre annul de fabricatie si anul de referinta 12 Calcule utilizand Excel: Regresia in Excel: 13 Obtinem âo = 43548.38 â1 = 1123,6754 â2 = -1172,5747 Interpretarea coeficientilor obtinuti ao = parametru de interceptare; a1, a2 = coeficienti de regresie partiali sau coeficienti panta â1 = -0.03407 arata ca, in perioada analizata, mentinanad celelalte variabile constante, atunci cand kilometrajul (x1) creste cu 1 Km, pretul de vanzare al autoturismului scade, in medie, cu -0.03407RON. â2 = -2191.6 arata ca, in perioada analizata, mentinand celelate variabile constant, atunci cand autoturismul se invecheste cu 1 an, pretul de vanzare al autoturismului scade scade, in medie, cu -2191.6 RON. âo = 43548.38 arata ca, daca cele doua variabile explicative, kilometrajul(x1) si vechimea(x2) au valoarea 0, valoarea medie pretului autoturismului este estimata la circa 43548.38 RON. Din output, observam ca 84,56% (R Square=0,845686) din variatia valorilor variabilei Pretul autoturismului se poate explica prin variatia valorilor variabilelor Kilometrii facuti si Vechime autoturism. Testarea validitatii modelului de regresie pentru un nivel de semnificatie 0,05 H0: a1 = a2 = 0 (modelul nu este valid statistic) (MSR=MSE) H1: nonH0 (modelul este valid statistic) (MSR>MSE) Statistica F= (MSR/MSE) are o distributie Fα;k; n−k-1 14 Rc: Fcalc > F tab => Respingem H0 si acceptam H1 Din tabelul ANOVA si conform ipotezei H1 putem afirma ca modelul este valid statistic deoarece MSR>MSE, adica 1718742805.31 > 33012812.93 Multicoliniaritatea variabilelor explicative Figură 7:Rergresia in EViews yi = 43548.38 -0.034072xi1 -2191.604xi2 Regresia arata ca variabila Kilometraj si variabila Anul de fabricatie explica 84% din variatia pretului unui autoturism second-hand . Ne uitam la Probabilitati: avem Prob=0,0044<0,05 si Prob=0,00000<0,05. Detectarea multicoliniaritătii pe baza coeficientilor de corelatie dintre variabilele explicative. Figură 8: Legatura intre variabile 15 Între variabilele X1 şi X2 există o legătură direct, insa nu foarte puernica r x1,x2=0.446103 Regresăm variabila X2 în raport cu variabila X1 Figură 9: Regresia variabilei X2 în raport cu variabila X1 Această regresie arată că există coliniaritate foarte slaba între X2 şi X1. Criteriul lui Klein. Se foloseşte pentru identificarea dependentelor liniare dintre 2 variabile exogene. Variabilele Xi,Xj sunt coliniare dacă Pas1. Se estimează modelul complet (cu k regresori) şi se retine R-Squared, notat . Pas2. Se calculează matricea de corelatii liniare ale variabilelor explicative Pas3. Dacă se identifică perechile de variabile puternic corelate . =0.845686 =0.446103 =0.199008 Avem 0.845686 >0.199008 => Variabilele X1 si X2 nu sunt puternic corelate. 16 Bibliografie: Datele au fost preluate de pe site-ul : https://www.autovit.ro/autoturisme/audi/a6/?search%5Bnew_used%5D=used Alte surse folosite pentru intelegerea si interpretarea rezultatelor:  Modele si metode econometrice / Silvia Spataru  Introducere in Econometrie utilizand Eviews/Andrei T,Stancu S,Iacob A  Teorie si Practica Econometrica/Voineagu V. 17 